草庐IT

python - FIXML python 解析器

全部标签

php - 在 PHP 中解析大型 XML

我需要在PHP中解析相当大的XML(例如300MB)。我怎样才能最有效地做到这一点?特别是,我需要定位特定标签并将其内容提取到一个平面TXT文件中,仅此而已。 最佳答案 您可以使用老式SAX-basedparsing以block的形式读取和解析XML使用PHP的方法xmlparserfunctions.使用这种方法,您可以解析的文档大小没有真正的限制,因为您一次只需读取和解析一个满缓冲区。解析器将触发事件以指示它已找到标签、数据等。有一个simpleexampl手册中的e显示了如何获取标签的开始和结束。为了您的目的,您可能还想使用x

Python:使用 minidom 搜索具有特定文本的节点

我目前面临的XML看起来像这样:345754这包含在层次结构中。我已经解析了xml,并希望通过搜索“345754”找到ID节点。 最佳答案 vartec的回答需要更正(抱歉,我不确定我能不能做到),它应该是:xmldoc=xml.dom.minidom.parse('your.xml')matchingNodes=[nodefornodeinxmldoc.getElementsByTagName("ID")ifnode.firstChild.nodeValue=='345754']它有两处错误:(i)标签名称区分大小写,因此匹配"i

java - Scala 中的容错 XML 解析

我希望能够解析格式不一定正确的XML。例如,我会寻找一个模糊的而不是严格的解析器,能够从错误嵌套的标签中恢复。我可以自己写,但值得先在这里问一下。更新:我想做的是从HTML中提取链接和其他信息。对于格式良好的XML,我可以使用ScalaXMLAPI。对于格式错误的XML,以某种方式(以某种方式)将其转换为正确的XML并以相同的方式处理它会很好,否则我将不得不拥有两组完全不同的函数来处理文档。显然,因为输入格式不正确,而我正在尝试创建一个格式正确的树,所以必须涉及一些启发式(例如,当您看到时,您将首先关闭然后当您看到时,您会忽略它)。但这当然不是正确的语法,因此没有正确的方法。

c# - 如何使用命名空间解析 XML

你好,我有一个xml文档:XXXXXXXXX如何使用LinqToXml获取名称属性列表?我尝试的任何方法似乎都不起作用...vardoc=XDocument.Load(@"feed.xml");varnames=doc.XPathSelectElements("/*/*[localname()='feeds']")//WhatshouldtheXpathbe,here?.Select(p=>new{Name=p.Descendants("name").First().Value}).ToList();有没有简单的方法可以做到这一点? 最佳答案

Python 的 libxml2 无法解析 unicode 字符串

好的,Python的libxml2绑定(bind)的文档确实是****。我的问题:XML文档存储在Python中的字符串变量中。该字符串是Unicode的实例,其中包含非ASCII字符。我想用libxml2解析它,看起来像这样:#-*-coding:utf-8-*-importlibxml2DOC=u"""Bäääh!"""xml_doc=libxml2.parseDoc(DOC)结果是:Traceback(mostrecentcalllast):File"test.py",line13,inxml_doc=libxml2.parseDoc(DOC)File"c:\Python26\l

python - 当我不知道会有多少层时,如何遍历数据结构的所有层级以提取所有数据?

我需要从结构中提取数据并将其放入列表中,但我不知道该结构有多少层。对于每个级别,我可以调用level.children(),如果当前级别之下没有级别,则返回[],如果有,则返回返回[object,object,...],我可以在其中的每一个上再次调用children()。我需要深入了解结构,直到将所有级别的数据提取到列表中。当基于这样的结构时:JohnSmithTeamNameAstadium列表应该是这样的:[[{'name':'name','attrs':{},'text':'JohnSmith','parent':None},],[{'name':'team','attrs':{

java - 如何使用 Java 解析 XML?

TL110.05.2.32001agentget.......................................................TL110.5.2.982001agentget.....................................................................我想知道如何使用Java解析此XML。这样我就可以以相同的给定方式为我的程序使用该数据。我知道如何解析它,但问题是每个命令可能有不同数量的数据block。所以在解析之后我需要为各自的命令使用各自的数据block。我的意思是,对于检索时的第一个命令,

C#,xml解析。获取标签之间的数据

我有一个字符串:responsestring="SOmetext"我怎样才能得到之间的值and?我的尝试:responseString.Substring(responseString.LastIndexOf("")+6,8);//thissortofworks,butwon'tworkineverysituation.也试过弄乱xmlreader,但找不到解决方案。类型 最佳答案 尝试XDocumentdoc=XDocument.Parse(str);vara=fromhashindoc.Descendants("hash")se

c# - 使用 C# 进行 XML 解析?

我正在为一个涉及大量XML解析的学校项目工作。我正在用C#编码,但我还没有找到一种“合适的”方法来解析这个XML。我看过几种不同的方法,但还没有找到正确的方法;所以我来找你。理想情况下,我正在寻找类似于Python中的BeautifulSoup的东西(有点)。我想知道是否有任何方法可以像这样转换XML:C:\\background.png012345C:\\image.pngEHRVEHRViewerVersion1.0C:\\ico\ehrv.png8181:iqLog像这样进入数组/Hastable/字典/其他:Array(["config"]=>array(["bgimg"]=>

python - 如何通过 Elementtree 检查属性存在?

我需要检查某些属性是否存在。喜欢:if"blah-blah-blah"isNone:print"thereisnosuchattribute"else:print"Theattributeexists" 最佳答案 Element对象具有attrib中的所有属性听写。if'blah'notinelem.attrib:print"thereisnosuchattribute" 关于python-如何通过Elementtree检查属性存在?,我们在StackOverflow上找到一个类似的问题